The Simpson’s Paradox in the Offline Evaluation of Recommendation Systems
نویسندگان
چکیده
Recommendation systems are often evaluated based on user’s interactions that were collected from an existing, already deployed recommendation system. In this situation, users only provide feedback the exposed items and they may not leave other since have been to them by As a result, dataset is used evaluate new model influenced system, as form of closed loop feedback. article, we show typical offline evaluation recommender suffers so-called Simpson’s paradox. paradox name given phenomenon observed when significant trend appears in several different sub-populations observational data but disappears or even reversed these combined together. Our in-depth experiments stratified sampling reveal very small minority frequently system plays confounding factor systems. addition, propose novel methodology takes into account confounder, i.e., system’s characteristics. Using relative comparison many models systems, Kendall rank correlation coefficient, our proposed exhibits statistically improvements 14% 40% examined open datasets (Yahoo! Coat), respectively, reflecting true ranking with (randomised) standard evaluation.
منابع مشابه
Reducing Offline Evaluation Bias in Recommendation Systems
Recommendation systems have been integrated into the majority of large online systems. They tailor those systems to individual users by filtering and ranking information according to user profiles. This adaptation process influences the way users interact with the system and, as a consequence, increases the difficulty of evaluating a recommendation algorithm with historical data (via offline ev...
متن کاملromantic education:reading william wordsworths the prelude in the light of the history of ideas
عصر روشنگری زمان شکل گیری ایده های مدرن تربیتی- آموزشی بود اما تاکید بیش از اندازه ی دوشاخه مهم فلسفی زمان یعنی عقل گرایی و حس گرایی بر دقت و وضوح، انسان عصر روشنگری را نسبت به دیگر تواناییهایش نابینا کرده و موجب به وجود آمدن افرادی تک بعدی شد که افتخارعقلانیتشان، تاکید شان بر تجربه فردی، به مبارزه طلبیدن منطق نیاکانشان وافسون زدایی شان از دنیا وتمام آنچه با حواس پنجگانه قابل درک نبوده و یا در ...
the analysis of the role of the speech acts theory in translating and dubbing hollywood films
از محوری ترین اثراتی که یک فیلم سینمایی ایجاد می کند دیالوگ هایی است که هنرپیش گان فیلم میگویند. به زعم یک فیلم ساز, یک شیوه متأثر نمودن مخاطب از اثر منظوره نیروی گفتارهای گوینده, مثل نیروی عاطفی, ترس آور, غم انگیز, هیجان انگیز و غیره, است. این مطالعه به بررسی این مسأله مبادرت کرده است که آیا نیروی فراگفتاری هنرپیش گان به مثابه ی اعمال گفتاری در پنج فیلم هالیوودی در نسخه های دوبله شده باز تولید...
15 صفحه اولthe effect of taftan pozzolan on the compressive strength of concrete in the environmental conditions of oman sea (chabahar port)
cement is an essential ingredient in the concrete buildings. for production of cement considerable amount of fossil fuel and electrical energy is consumed. on the other hand for generating one tone of portland cement, nearly one ton of carbon dioxide is released. it shows that 7 percent of the total released carbon dioxide in the world relates to the cement industry. considering ecological issu...
the effect of the record infancy in crimilly acts of guilties (in karaj city)
چکیده یکی از مهمترین دغدغه های بزرگ جوامع بشری، از دیر باز تا کنون که ذهن پژوهشگران و متخصصان بهداشت روانی و اجتماعی و دولتها رابه خود مشغول داشته، مسأله ی بزهکاری می باشد. شناخت کامل پدیده ی بزهکاری و بزهکار، علل وعوامل سقوط یک انسان، چگونگی درمان وی و درنهایت پیشگیری ازبزهکاری ودریک کلام سالم سازی یک جامعه، رسالت عظیم، انسانی ومقدسی می باشد که با بررسی شخصیت مجرم یعنی[ انسانی که تحت شرای...
15 صفحه اولذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: ACM Transactions on Information Systems
سال: 2021
ISSN: ['1558-1152', '1558-2868', '1046-8188', '0734-2047']
DOI: https://doi.org/10.1145/3458509